View on GitHub

Notas de aprendizajes

Notas tomadas durante mis experimentos y otras cosas

Machine Learning es un concepto que lleva sonando mucho tiempo. No es que pretenda convertirme en un experto del día a la mañana, pero el curso Understanding Machine Learning es corto y parece que puede explicar los conceptos básicos de una forma sencilla.

Contenidos del curso:

Notas tomadas

Básicamente, ¿qué hace el Machine Learning? Busca patrones en los datos, y usa esos patrones para tratar de predecir el futuro.

¿Qué partes componen un sistema de ML?

  1. Los datos: que son los que continen los patrones
  2. El algoritmo: que es quien encuentra los patrones en los datos. Con esos patrones, se crea un:
  3. Modelo: que es quien reconoce los patrones en los datos que le envíe la:
  4. Aplicación: es el software que proporciona utilidad al usuario. Proporciona los datos actuales al modelo, y el modelo responde con la predicción

Machine Learning in a nutshell

El proceso que sigue Machine Learning

Machine Learning in a nutshell

Partimos de datos en crudo. Pueden ser varias fuentes. Esos datos en crudo se pre-procesan (muchas veces con módulos proporcionados por terceras partes) para crear los Datos preparados. No vamos a acertar a la primera, por lo que este proceso es iterativo.

Con esos Datos preparados, aplicaremos algoritmos de aprendizaje (normalmente son algoritmos proporcionados también por terceras partes) para crear un Candidato a modelo. De nuevo, este proceso es iterativo.

Cuando estemos contentos con nuestro Candiato a modelo, lo desplegaremos llegando a un Modelo elegido. Nuestras aplicaciones se comunicarán con este modelo para obtener las predicciones.

Este es un proceso que no tiene porqué acabar. Si consideramos que el Modelo elegido no es lo suficientemente bueno, podemos empezar el proceso desde el principio, aplicando los aprendizajes que hayamos hecho en esta iteración global.

Terminología:

Categorías de los problemas en ML:

Estilos de algoritmos de ML: árboles de decisión, redes neuronales, bayesianos (probabilidades), K-medias (clustering?)

Referencias